基于规则的决策模型由于其可解释性而具有吸引力。但是,现有的规则诱导方法通常会导致长期且因此不容易解释的规则模型。这个问题通常可以归因于缺乏适当表达性的词汇,即决策模型中用作文字的相关谓词。大多数现有的规则归纳算法都假定了预定义的文字,从而自然地将文字的定义与规则学习阶段解耦。相比之下,我们提出了关系规则网络(R2N),这是一种神经体系结构,学习了代表数值输入特征之间线性关系以及使用它们的规则的文字关系。这种方法通过直接以端到端的方式将文字学习与规则学习联系起来,为提高诱发决策模型的表现力打开了大门。在基准任务上,我们表明这些学识渊博的文字足够简单,可以保留可解释性,但提高了预测准确性,并提供了与最先进的规则归纳算法相比更简洁的规则。
translated by 谷歌翻译
部分微分方程(PDE)的自动模型发现通常考虑单个实验或数据集以推断底层的控制方程。在实践中,实验在不能简单地平均出来的参数,初始和边界条件下具有固有的自然变性。我们介绍了一个随机的自适应组套索稀疏性估算器,以促进分组的稀疏性并在基于深入的学习PDE发现框架中实施。它允许创建一个学习偏差,其意味着先验的假设,即所有实验都可以用具有潜在不同系数的相同的基础PDE术语解释。我们的实验结果显示了更广泛的PDE,可以从多个高度嘈杂的数据集中找到,通过此分组的稀疏性促销,而不是简单地执行独立的模型发现。
translated by 谷歌翻译
大气污染仍然是全球主要的公共卫生威胁之一,估计每年7万人死亡。在非洲,快速的城市化和运输基础设施不良正在加剧问题。在本文中,我们分析了非洲不同地理区域的PM2.5的时空变化。西非地区仍然受到高水平污染的影响最大,每天平均40.856 $ \ mu g/m^3 $在拉各斯,阿布贾和巴马科等某些城市。在东非,乌干达报告的污染水平最高,每日平均浓度为56.14 $ \ mu g/m^3 $和38.65 $ \ mu g/m^3 $,用于基加利。在非洲中部地区的国家/地区,每日最高的平均浓度为90.075 $ \ mu g/m^3 $,记录在N'djamena中。我们比较了三个数据驱动模型,以预测污染水平的未来趋势。神经网络的表现优于高斯过程和Arima模型。
translated by 谷歌翻译
数据系列分类是数据科学中的一个重要且具有挑战性的问题。通过找到导致算法做出某些决策的输入的判别部分来解释分类决策是许多应用程序的真正需求。卷积神经网络对于数据系列分类任务表现良好;但是,对于多元数据系列的特定情况,这种类型的算法提供的解释很差。解决这一重要限制是一个重大挑战。在本文中,我们提出了一种新的方法,可以通过突出时间和维度判别信息来解决此问题。我们的贡献是两个方面:我们首先描述一个卷积架构,可以比较维度;然后,我们提出了一种返回DCAM的方法,DCAM是专为多元时间序列(和基于CNN的模型)设计的尺寸类激活图。使用几个合成数据集的实验表明,DCAM不仅比以前的方法更准确,而且是多元时间序列中判别特征发现和分类说明的唯一可行解决方案。本文出现在Sigmod'22中。
translated by 谷歌翻译
训练机学习(ML)算法是一个计算密集型过程,由于反复访问大型培训数据集,经常会陷入内存。结果,以处理器为中心的系统(例如CPU,GPU)遭受了内存单元和处理单元之间的昂贵数据移动,这会消耗大量的能量和执行周期。以内存为中心的计算系统,即具有内存(PIM)功能,可以减轻此数据运动瓶颈。我们的目标是了解现代通用PIM体系结构加速ML培训的潜力。为此,我们(1)在现实世界通用PIM体系结构上实现了几种代表性的经典ML算法(即线性回归,逻辑回归,决策树,K-均值聚类),(2)严格评估并表征它们在准确性,性能和缩放方面以及(3)与CPU和GPU上的对应物实现相比。我们对具有2500多个PIM核心的真实内存计算系统的评估表明,当PIM硬件在必要的操作和数据类型上,通用PIM架构可以极大地加速内存的ML工作负载。例如,我们对决策树的PIM实施比8核Intel Xeon上的最先进的CPU版本$ 27 \ times $ $,并且比最先进的GPU快$ 1.34 \ times $ $ NVIDIA A100上的版本。我们在PIM上的K-Means聚类分别为$ 2.8 \ times $和$ 3.2 \ times $ $,分别是最先进的CPU和GPU版本。据我们所知,我们的工作是第一个评估现实世界中PIM架构的ML培训的工作。我们以关键的观察,外卖和建议结束,可以激发ML工作负载的用户,PIM架构的程序员以及未来以内存计算系统的硬件设计师和架构师。
translated by 谷歌翻译
我们从一组稀疏的光谱时间序列中构建了一个物理参数化的概率自动编码器(PAE),以学习IA型超新星(SNE IA)的内在多样性。 PAE是一个两阶段的生成模型,由自动编码器(AE)组成,该模型在使用归一化流(NF)训练后概率地解释。我们证明,PAE学习了一个低维的潜在空间,该空间可捕获人口内存在的非线性特征范围,并且可以直接从数据直接从数据中准确地对整个波长和观察时间进行精确模拟SNE IA的光谱演化。通过引入相关性惩罚项和多阶段训练设置以及我们的物理参数化网络,我们表明可以在训练期间分离内在和外在的可变性模式,从而消除了需要进行额外标准化的其他模型。然后,我们在SNE IA的许多下游任务中使用PAE进行越来越精确的宇宙学分析,包括自动检测SN Outliers,与数据分布一致的样本的产生以及在存在噪音和不完整数据的情况下解决逆问题限制宇宙距离测量。我们发现,与以前的研究相一致的最佳固有模型参数数量似乎是三个,并表明我们可以用$ 0.091 \ pm 0.010 $ mag标准化SNE IA的测试样本,该样本对应于$ 0.074 \ pm。 0.010 $ mag如果删除了特殊的速度贡献。训练有素的模型和代码在\ href {https://github.com/georgestein/supaernova} {github.com/georgestein/supaernova}上发布
translated by 谷歌翻译
基于仿真的推理(SBI)是一个有前途的贝叶斯推理框架,可以减轻对分析可能性估计后验分布的需求。使用SBI算法中神经密度估计器的最新进展表明,以大量模拟为代价实现高保真后代的能力。当使用复杂的物理模拟时,这使得他们的应用程序可能非常耗时。在这项工作中,我们着重于使用模拟器的梯度来提高后密度估计的样本效率。我们提出了一种使用可区分模拟器执行神经后验估计(NPE)的新方法。我们展示了梯度信息如何有助于限制后部形状并提高样本效率。
translated by 谷歌翻译
在本文中,我们在不确定的沟通和对抗性攻击者的影响下解决了多机器人信息路径计划(MIPP)任务。目的是创建一个多机器人系统,尽管存在损坏的机器人共享恶意信息,但仍可以学习并统一对未知环境的知识。我们使用高斯工艺(GP)来对未知环境进行建模,并使用相互信息的指标来定义信息。我们MIPP任务的目标是最大化团队收集的信息量,同时最大程度地提高弹性弹性的可能性。不幸的是,这些目标是矛盾的,尤其是在探索需要机器人之间断开连接的大环境时。结果,我们强加了一个概率的通信约束,该概率可以使机器人间歇性地满足和弹性地共享信息,然后在所有其他时间内采取行动以最大程度地提高收集的信息。为了解决我们的问题,我们选择具有最高弹性概率的会议位置,并使用顺序贪婪算法来优化机器人探索的路径。最后,我们通过比较应用弹性和非弹性MIPP算法的良好行为机器人的学习能力来展示结果的有效性。
translated by 谷歌翻译
训练机学习算法是一个计算密集型过程,由于反复访问大型培训数据集,因此经常会限制内存。结果,以处理器为中心的系统(例如CPU,GPU)遭受了内存单元和处理单元之间的昂贵数据移动,这会消耗大量的能量和执行周期。以内存为中心的计算系统,即具有内存处理(PIM)功能的计算系统,可以减轻此数据运动瓶颈。我们的目标是了解现代通用PIM体系结构加速机器学习培训的潜力。为此,我们(1)将几种代表性的经典机器学习算法(即线性回归,逻辑回归,决策树,K-均值聚类)上实现在现实世界通用PIM架构上(2)以术语来表征它们与CPU和GPU上的同行实现相比,(3)将其准确性,性能和缩放率进行比较。我们对具有2500多个PIM核心的内存计算系统进行的实验评估表明,当PIM硬件在必要的操作和数据类型上,通用PIM体系结构可以极大地加速记忆的机器学习工作负载。据我们所知,我们的工作是第一个评估现实世界通用PIM体系结构的机器学习算法培训的工作。
translated by 谷歌翻译
在这项工作中,我们介绍了一个非线性动力学观点,可以为腿部系统的充满活力保守的模型生成和连接步态。特别是,我们表明,保守步态的集合构成了步态空间中局部定义的1D子手机的连接空间。这些歧管是通过能级的无坐标参数化的。我们提出了通过使用数值延续方法,生成集合和分叉点来识别步态家族的算法。为此,我们还介绍了数值实现的几个详细信息。最重要的是,我们为德拉斯斯矩阵建立了必要条件,以在影响范围内保持能量。我们工作的一个重要应用是简单的腿部运动模型,通常能够以几个自由度和少量的物理参数来捕获腿部运动的复杂性。我们证明了框架在具有四个自由度的单足料斗中的功效。
translated by 谷歌翻译